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基于 表情 符 注意 力 机 制 的 微 博 情感 分 析 模 型 
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摘 要 : 为 了 对 中 文 微 博 进 行 有 效 的 情感 极 性 识别 ， 基 于 表情 符 能 改变 或 加 强 微 博文 本 的 情感 极 性 这 一 认 知 事实 ， 提 
出 基于 表情 符 注 意 力 机 制 的 微 博 情感 分 析 神 经 网 络 模型 。 该 模型 在 使 用 双向 循环 神经 网 络 模型 (Bi-LSTM) 学 习 文 本 
的 特征 表示 时 ， 利 用 表情 符 注意 力 机 制 ， 得 到 文本 结合 表情 符 后 新 的 特征 表示 ， 从 而 实现 微 博 情感 识别 。 实 验 结果 显 
示 ， 与 输入 纯 文本 和 表情 符 的 Bi-LSTM 模型 相 比 ， 基 于 表情 符 注 意 力 机 制 的 模型 准确 率 提 高 了 4.06%; 与 仅 输入 纯 文 
本 的 Bi-LSTM 模型 相 比 ， 基 于 表情 符 注意 力 机 制 的 模型 准确 率 提 高 了 6.35%。 
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Emoji-attentional neural network for microblog sentiment analysis 
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Abstract: In order to effectively identify the sentiment polarity of Chinese microblogs, based on the cognitive fact that emojis 
can change or enhance the sentiment polarity of the texts, this paper proposed an emoji attentional neural network model for 
microblog sentiment analysis. This model firstly use a Bi-LSTM model to learn the feature representation of the text, and then 
an emoji-based attention mechanism is implemented to obtain a new feature representation after combining text with the emojis, 
so as to recognize the sentiment polarity of the microblogs. The experiments show that compared with the Bi-LSTM model that 
inputs plain text and emojis, the accuracy rate of the emoji-attentional model is increased by 4.06%; compared with the Bi- 
LSTM model that only inputs plain text, the accuracy rate of emoji-attentional model is increased by 6.35%. 
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E Hè 言语 成 份 ， 如 面部 表情 ， 姿 态 等， 表达 交流 者 之 闻 的 情感 03， 
他 们 认为 ， 在 社交 媒体 中 ， 表 情 符 对 文本 的 情感 表达 产生 最 重 

现 如 今 ， 微 博 是 人 们 交流 信息 、 表 达 情 感 和 观点 最 重要 的 。 ”要 影响 ， 甚 至 能 改变 文本 的 情感 极 性 。 如 下 面 两 个 例子 

媒介 之 一 ， 已 有 大 量 的 研究 工作 聚焦 于 微 博 文本 ， 如 与 情 分 析 四 明天 要 上 学 国 

口 ， 突 发 事件 检测 器 ,观点 挖掘 四 和 情感 分 析 &s 等 ， 其 中 情感 分 @ 妈 妈 给 我 的 生日 礼物 国 

析 是 微 情 研究 的 基础 及 重点 话题 之 一 。 当 前 情感 分 析 采 用 的 主 文本 的 情感 变化 如 图 1 所 示 。 

要 方法 包括 支持 向 量 机 四， 决策 树 趾 ， 及 神经 网 络 区 il 等 模型 。 za ae 

为 表达 情感 和 观点 ， 人 们 在 微 博 中 使 用 了 大 量 的 表情 符 ， 因 此 

在 情感 分 析 的 任务 中 ， 许 多 研究 者 也 把 表情 符 作为 重要 的 因素 中 性 中 性 

融入 到 模型 中 。 常 用 的 方法 是 把 表情 符 作为 模型 特征 0 号 或 一 明天 要 上 学 “| 为 妈妈 给 我 的 生日 礼物 

种 自然 标注 13 的 ， 用 于 扩充 训练 语 料 。 然 而 研究 0 显示 表情 符 和 BID 

直接 当 作 情感 标签 会 产生 很 多 噪声 。 
社会 及 认 知 学 领域 研究 认为 表情 符 类 似 于 人 类 交流 中 的 非 图 1 微 博文 本 的 情感 变化 
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aS it @, 等; 基于 表情 符 注意 


可 以 看 出 ， 表 情 符 对 文本 的 情感 表达 起 着 重要 作用 。 但 微 程 ， 已 广泛 应 用 于 情感 分 析 。 大 多 数 方法 采用 RNN,CNN 等 模 
博 的 情感 表达 并 非 文本 与 表情 符 的 简单 相 加 ， 例 如 两 个 例子 虽 Æ. Chen 等 人 09 提 出 了 一 个 结合 用 户 -产品 的 注意 力 机 制 ， 用 
然 具 有 相同 的 表情 符 ， 但 在 不 同 的 文本 下 ， 其 产生 的 作用 是 不 ”以 完成 情感 分 析 任 务 。Zhang 等 人 0 提出 了 门 机 制 。 这 些 模型 


同 的 。 这 种 作用 类 似 于 神经 网 络 的 注意 力 机 制 ， 在 一 个 微 主要 把 文本 作为 输入 ， 没 有 考虑 表情 符 对 文本 的 作用 。 
博 句 子 中 ， 每 个 词语 的 信息 量 权 重 是 不 同 的 ， 表 情 符 同时 也 对 在 社交 媒体 如 新 浪 微 博 、twitter 中 ， 存 在 着 大 量 的 表情 符 
文本 中 词语 的 权重 产生 影响 ， 改 变 文本 的 表达 ， 进 而 改变 文本 ”号 ， 用 于 表达 用 户 的 情感 及 观点 。 当 前 对 表情 符 的 使 用 策略 主 
的 情感 极 性 表达 。 要 包括 三 种 : 

因此 本 文 结合 这 两 者 ， 提 出 基于 表情 符 注意 力 机 制 的 神经 第 一 类 策略 ("由 是 将 表情 符 看 做 是 一 种 自然 标注 ， 该 策略 


网 络 模型 。 图 2 给 出 了 本 文 所 提 模 型 框架 例子 。 把 微 博 分 成 两 。 ”假设 表情 符 独 立 的 表达 了 用 户 的 情感 和 观点 。Purver 等 人 MI 使 
类 信息 : 文本 和 表情 符 。 模 型 首先 对 输入 文本 采用 双向 循环 神 ] Twitter 数据 中 的 标签 (hashtags) 和 表情 (emotions) 来 产生 
经 网 络 网 络 模型 (Bi-LSTM) 学 习 出 文本 的 低 维 特征 表示 ， 然 后 训练 数据 集 。 实 验 结果 表明 ， 本 方法 在 快乐 (hapiness) 、 伤 心 
结合 表情 符 的 向 量 ， 输 入 表情 符 注意 力 网 络 层 ， 改 变 文本 中 单 (sadness)、 愤 怒 (anger) 三 种 表情 作为 情绪 标签 时 比较 有 效 ， 


— 


词 的 权重 ， 进 而 得 到 文本 的 特征 表示 ， 最 后 利用 分 类 方法 得 到 ”而 对 于 其 他 类 型 的 表情 效果 不 佳 。 Davidov AMIE a, 
文本 的 情感 标签 。 于 表情 符 存在 歧义 ， 即 同一 个 表情 符 也 可 是 正 性 ， 也 可 能 是 
Category +0- 负 性 ， 因 此 利用 表情 符 建 立 的 训练 语 料 包 含 许多 噪音 ， 可 能 会 

565 训练 模型 产生 副作用 。 
sin BRRR. EKNE EE J AERA SD A 
on == 型 中 。Jiang 等 人 09 在 SVM 模型 中 融合 了 微 博 结构 特征 、 句 子 


representation 


结构 特征 与 表情 特征 ， 对 微 博 进行 正面 、 中 性 、 负 面 的 三 类 情 
感 分 类 。 这 类 策略 也 没有 体现 表情 符 对 文本 的 情感 作用 。 

第 三 类 策略 是 把 表情 符 和 文本 看 作 两 个 并 列 的 信息 源 。 
Hogenboo 等 人 PM" 将 社交 媒体 文本 分 成 表情 符 和 文本 两 部 分 


Emoji-Attention | 
Layer 


ees v 然后 分 别 采 用 不 同 的 模型 计算 出 各 自 的 情感 ， 最 后 两 个 情感 线 
性 组 合 得 到 最 终 的 文本 情感。 

eee 2) 上 述 三 种 策略 ， 虽 然 在 模型 中 考虑 了 表情 符 ， 但 没有 考虑 
到 表情 符 对 文本 的 作用 机 制 。 

se Aeae n 注意 力 机 制 早 期 运用 于 图 像 处 理 P0， 近 来 也 被 逐步 运用 于 

renatin [S| lel |8 $ e| [8 自然 语言 处 理 ， 其 作用 是 从 众多 信息 中 选择 出 关键 信息 。 在 自 

7 tf if (i f i 然 语 言 处 理 中 ， 研 究 显示 注意 力 机 制 对 机 器 翻译 cj、 问 答 系统 

zl、 情感 分 析 19 性 能 都 有 较 大 提升 。 本 文 提出 基于 表情 符 注意 

图 2 基于 表情 符 注意 力 机 制 的 模型 框架 力 机 制 的 神经 网 络 模型 ， 较 好 地 模拟 了 表情 符 对 文本 的 情感 作 


本 文 的 主要 贡献 如 下 : a) 构建 了 一 个 基于 表情 符 的 微 博 情 用 这 一 认 知 事实 。 
感 标注 语 料 。 该 语 料 共 包含 6905 条 微 博 ;b) 不 同 于 以 往 仅 将 表 


as | 2 ”模型 
情 符 作为 单个 特征 的 工作 ， 本 文 在 处 理 语 料 时 ， 将 微 博 中 的 表 
情 符 与 词语 同时 训练 ， 得 出 含有 上 下 文 信息 的 表情 符 词 向 量 ， 2.1 基于 Bi-LSTM 模型 的 情感 分 类 模型 
提出 基于 表情 符 注意 力 机 制 的 神经 网 络 模型 。 实 验 结果 也 显 双向 长 短 时 记忆 模型 (Bi-LSTM) 是 一 种 特殊 循环 神经 网 
示 了 该 模型 的 有 效 性 。 络 RNN) 模型 ， 主 要 目的 用 来 处 理 序列 数据 ， 其 在 自然 语言 
处 理 中 取得 了 广泛 应 用 。 在 情感 分 类 任务 中 ， 该 模型 通常 被 运 


» SE 于 学 习 句 子 的 表示 , 然后 依据 表示 对 文本 作 情 感 分 类 。Yang 等 

情感 分 析 是 对 带 有 情感 色彩 的 主观 性 文本 进行 分 析 、 处 理 、 人 [9 使 用 了 Bi-LSTM 完成 文档 分 类 , 取得 了 较 好 的 效果 。 下面 
归纳 和 推理 的 过 程 。 例 如 对 电影 的 评论 ， 产 品 的 评价 ， 情 感 分 。 简要 介绍 Bi-LSTM 模型 。 
析 有 助 于 客观 评价 产品 。 其 通常 被 看 作 是 一 个 分 类 问题 ， 各 种 LSTM 是 特殊 的 循环 神经 网 络 ,能 够 提升 神经 网 络 接受 输 
分 类 模型 被 广泛 应 用 该 类 任务 ,如 SVM、 决 策 树 、 神 经 网 络 等 ， 入 信息 及 训练 数据 的 记忆 机 制 ,让 输出 结果 得 到 大 幅度 的 提升 。 
常用 的 特征 包括 单词 、 单 词 数 、 词 性 、 句 法 等 ， 以 及 人 工 标注 
的 情感 词典 。 

近年 来 神经 网 络 模型 飞速 发 展 ， 由 于 避免 了 复杂 的 特征 工 


= 


对 于 短文 本 中 的 第 t 个 单词 Ww, ,首先 模型 将 w, 映射 到 一 个 词 向 


录用 稿 


ft x, e 民 ”, 一 个 LSTM 单元 的 输入 为 :单词 x, ,上 一 输出 隐 状 


态 有 ,上 一 内 存 状态 C,_ | ,输出 为 及 ,C,。 具 体 公式 如 下 : 


i, =o(Wx, +U,h +D) 
f=o(Wx, +U h, +b,) 
=tanh(W x +U „h, +b.) 
= f,Oc,_, +i, OC, 

o, =0(W,x, +U h, +b,) 
h =o, © tanh(c, ) 


C, 
C, 


对 于 普通 的 LSTM， 其 存在 一 个 缺点 ， 即 只 能 


E 向 读 取 文 


不 同 于 3.1 节 ， 在 本 节 中 ，, S[h,h,...,h,] NAM Bi- 


LSTM 神经 网 络 后 ， 微 博 中 纯 文本 {Wi, WW} 的 表示 。 则 


整个 句子 的 表示 如 下 : 


s= > CQ 用 (3) 


t=1 


此 处 cx 表示 了 句子 第 ! 个 词 结合 


模型 表示 的 第 t 个 词 在 句子 中 的 注意 力 权 重 ，Q, 的 定义 如 下 : 


本 ， 


因此 本 文 使 


用 能 够 双向 读 取 文本 的 Bi-LSTM 模型 。Bi- 


exp(score(h,, Vv, )) 


LSTM 包含 一 个 正 向 的 LSTM ， 


由 X, BILE Xx, ,以 及 一 个 反 


向 的 LSTM， 


Xr KFI X: 

x, =W,w,,te[l,T] 
h, = LSTM(x,),t € [1,T] 
h, = LSTM(x,),t € [T,1] 


经 过 这 一 层 , 模型 将 一 个 单词 x 转换 为 一 个 隐 变 量 , 将 万 


15], 拼接 起 来 即 为 单个 单词 的 表示 ， 即 hh on» HEES 
了 [hhb,… 所 ]， 再 将 其 传 入 一 个 平均 池 化 层 ， 则 得 到 单个 句子 


的 表示 s 。 
2.2 ”基于 表情 符 注意 力 机 制 的 Bi-LSTM 情感 分 类 模型 

为 了 表示 表情 符 对 文本 的 作用 机 制 ， 本 文 提 出 表情 符 注意 
力 机 制 ， 以 建 模 表情 符 对 文本 的 作用 。 对 于 一 条 微 博 ， 其 每 个 
词语 对 于 情感 极 性 影响 是 不 同 的 ， 与 表情 符 作 用 的 效果 也 是 不 


同 的 。 表 情 符 注意 力 机 制 ， 用 以 衡量 与 表情 结合 后 ， 微 博 中 的 
词语 的 重要 程度 权重 。 


HRE: {M Wi Wr Ep Esen Eppo HF 


ye exp(score(h,,v, )) 


(4) 


score 为 衡量 单词 与 表 
数 ， Score 的 定义 如 下 : 


score(,,v,)=V" 


Ap: Wg, W, 为 权重 和 矩阵， 


E, 


量 ，VTI 表 示 V 的 转 


2.3 优化 目标 


情 符 组 合 后 的 重要 程度 的 打分 函 


tanh(W,,h,+W,v,+b) 6) 


b 为 偏 置 向 量 ， VARA 


Mm 
a 


在 引入 表情 符 注意 力作 


机制 后 ， 得 到 文本 的 最 终 向 量 表 


示 S。 为 了 对 文本 作 情 感 分 关 


天 ， 模 型 使 用 一 个 非 线 性 函数 把 文 


本 表示 映射 到 一 个 目标 类 别 空间 。 


d, =tanh(W.s +b.) (6) 
然后 ， 采 用 softmax 函数 来 获取 其 情感 分 布 。 
exp(d,) 
c 一 Se exp(d,) (7) 


其 中 : C 表示 情感 标签 个 数 ，p, 表示 情感 标签 C 的 预测 


w, file 


Ph 经 过 分 词 后 的 词语 ， 上 上 ; 表示 微 博 中 的 表情 符 。 首 


模型 采 


JZ SMTA ER 


模型 的 损失 函数 。 若 D 表示 训练 


d 为 词 向 量 的 维 数 。 表 情 符 


se, w, 5 E 都 转换 为 词 向 量 的 表示 交 eR je, eR. 这 里 


的 向 量 表示 为 


= ISe (2) 


于 许多 微 博 用 


户 都 会 在 同 


条 微 博 中 发 表 多 个 同样 的 表 


情 ， 此 处 对 微 博 中 的 表情 符 


向 量 取 平均 值 ， 以 防止 单个 表情 符 


的 权重 过 大 ， 影 响 模型 的 效果 。 


微 博 集 ， 则 基于 表情 符 注 意 力 机 制 的 模型 损失 函数 表示 如 下 : 


L=-> > p£ (d)log(p.(d)) (8) 


deD c=1 
3 实验 
3.1 数据 集 
为 了 训练 和 测试 语 料 ， 从 新 浪 微 博 抽 取 了 2017 年 4 月 份 
包含 有 表情 符 的 10 万 条 微 博 ， 使 用 jieba 中 文 分 词 器 进行 分 


词 ， 蔡 换 掉 微 博 中 的 网 址 、 用 户 及 话题 标签 等 。 过 滤 掉 长 度 小 
于 5 的 微 博文 本 。 然 后 随机 抽取 其 中 的 1 万 多 条 微 博文 本 作为 
待 标注 微 博 ， 同 时 要 求 每 个 表情 符 出 现 的 次 数 大 于 10 次 ， 去 


在 表 2 中 


录用 稿 a &, $: eee VE | 


性 微 博 中 含有 部 分 具有 倾向 


除 重复 以 及 表情 符 过 少 的 微 博 后 得 到 6905 条 语 料 。 在 标注 微 。 ”不 具有 倾向 性 ， 另 一 个 原因 是 部 分 用 户 对 于 表情 符 的 使 用 比较 
博时 ， 其 情感 标签 分 为 三 类 : 正 性 、 中 性 和 负 性 。 语 料及 标注 ”随意 , 使 用 与 正文 无 关 的 表情 符 .以 下 两 句 话 是 实际 上 为 中 性 ， 
统计 如 表 1 所 示 。 但 识别 为 正面 的 微 博 : 
表 1 语 料 统计 KAGE EK My, 9A UI EARR, GG 

语 料 正 性 中 性 负 性 XAT EQ AHI FR, VEEN T HIETE. 

6905 3113 1926 1866 WHE 
不 同 表情 符 个 数 ”表情 符 出 现 总 次 数 ”个 数 /实例 表 3 显示 基于 表情 符 注意 力 机 制 模型 要 好 了 
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32 实验 设置 3 给 出 对 不 同情 感 极 性 的 微 博 的 识别 精度 。 

为 了 得 到 微 博 中 词语 与 表情 符 的 向 量 表示 ， 本 文采 用 抽取 ” 符 后 ， 极 性 为 负 的 准确 率 有 较 大 提升 ， 

的 100 M 微 博 语 料 进 行 预 训练 。 对 上 述 语 料 经 过 如 4.1 节 步 又 ”的 识别 率 ， 而 中 性 极 性 准确 率 最 低 ， 说 明 负 改 


的 分 词 与 预 处 理 后 ， 普 通 词语 与 表情 符号 作为 同类 单词 看 待 。 
单词 向 量 表示 采用 SkipGram 模型 253 预 训练 ， 词 向 量 表示 维 
为 300。 由 此 便 可 得 到 微 博 词语 的 向 量 表示 与 包含 上 下 文 信 |) 
的 表情 符 向 量 表示 。 若 模型 运行 时 出 现 不 在 词 向 量词 表 中 的 词 
语 或 表情 符 ， 采 用 随机 初始 化 。 

微 博文 本 的 表示 采用 Bi-LSTM 来 学 习 。 每 个 隐 结 点 的 向 量 
为 100 维 ， 微 博 每 个 单词 的 表示 由 双向 的 隐 向 量 连接 而 成 ， 因 
此 每 个 单词 的 输出 表示 为 200 维 。 训 练 时 采用 Adadelta 方法 P9 
对 参数 进行 优化 。 在 每 一 次 优化 过 程 中 , 模型 将 更 新 权重 矩阵 、 
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和 向量、 和 表情 符 向 量 。 训 练 次 数 为 100 次 。 
实验 时 标注 语 料 按 8:1:1 分 别 分 为 训练 集 、 开 发 集 和 测试 
集 。 采 用 准确 度 (accuracy) 来 表示 评估 实验 的 性 能 。 

实验 结果 

本 实验 的 主要 目 
验 中 给 出 三 个 基线 。 


a) Emoji-based, 


偏 Ta] [Fa E 


此 在 实 


标 是 测试 表情 符 对 文本 的 作用 ， 天 


仅 用 表情 符 自 身 极 性 作为 判断 依据 。 每 个 表 
情 符 的 极 性 由 人 工 标注 得 出 。 

b)Bi-LSTM-text, 纯 文本 输入 Bi-LSTM 情感 分 析 网 络 模型 。 
去 掉 微 博 中 的 表情 符 ， 以 纯 文本 作为 网 络 的 输入 ，Bi-LSTM 得 
到 的 微 博 表 示 直 接 作为 判断 模型 的 特征 向 量 。 优 化 目标 及 训练 
方法 与 本 文 模 型 相同 。 

c) Bi-LSTM-text-emoji, 纯 文本 + 表情 符 输入 的 Bi-LSTM 情 
感 分 析 网 络 模型 。 保 留 微 博 中 的 表情 符 ， 把 表情 符 和 文本 同时 
作为 网 络 的 输入 ，Bi-LSTM 得 到 的 微 博 表示 直接 作为 判断 模型 
的 特征 向 量 。 优 化 目标 及 训练 方法 与 本 文 模型 相同 。 
3.4 实验 分 析 

表 2 显示 了 各 个 模型 的 识别 准确 度 。 从 表 中 可 以 发 现 ， 把 
表情 符 引 入 模型 后 , 识别 性 能 相 比 只 输入 纯 文本 的 模型 68. 51%， 
提升 至 70. 80%。 主 要 是 因为 在 微 博文 本 , 存在 许多 搞怪 、 自 嘲 、 
及 讽刺 的 文本 ， 表 情 符 的 加 入 ， 引 起 文本 的 情感 极 性 的 改变 ， 
但 单纯 从 文本 识别 不 出 来 。 比 较 基 于 注意 力 模型 与 非 注意 力 的 
表情 符 模 型 ， 基 于 注意 力 的 模型 准确 率 上 升 至 74. 86%。 可 以 看 


出 基于 表情 符 的 注意 力 机 制 能 更 为 有 效 地 表示 文本 的 情感 。 
， 中 性 情感 的 微 博 准确 率 依然 较 低 ， 这 是 因为 中 


的 词语 和 表情 符 ， 同 时 


文本 本 身 又 


性 影响 


fae 


值 。 


最 大 ; 表情 符 对 


H 


F 表 情 符 作 特征 
E 微 博 的 影响 ， 表 


可 以 看 出 添加 表情 


同时 也 超过 了 极 性 为 正 
表情 符 对 文本 极 


面 给 出 几 个 例子 ，Emoji-Attention 
Bi-LSTM (LSTM-EA ) 模型 能 够 
texttemoji (LSTM-E) 没 


识 


AAA 


识别 出 来 。 


将 各 词语 的 向 量 平均 起 来 
测 。 而 LSTM-EA 模型 由 于 考虑 到 各 词语 


的 权重 不 


别 ， 而 


同 ， 预 测 正 


FE 微 博 准 确 率 影响 不 大 ， 但 显著 提升 


Bi-LSTM- 


的 反讽 的 例子 , 此 时 LSTM-E 模型 仅 
作为 分 类 器 的 输入 ， 产 生 了 错误 的 预 


确 。 而 例子 3) 与 )LSTM-E 预测 错误 也 是 因为 只 考虑 了 微 博 中 


一 些 负面 词 


由 于 在 


T 


上 面 实验 
纯 文本 的 模型 ， 


微 博 
例子 ， 因 此 本 文 所 提 


语 ， 而 忽视 了 整体 情感 需要 事 
FP 存在 许多 反讽 以 及 类 似 
的 模型 是 
说 明了 本 文 所 提 模 型 结果 性 
也 优 于 只 将 表情 符 作为 特征 节 


因 是 表情 符 改变 或 加 强 了 文本 的 极 性 ， 同 时 
也 发 气 出 了 文本 内 部 的 语义 权重 


体 的 作用 。 
加 “ 话 锋 一 转 ” 的 
用 价值 的 。 

能 显著 优 于 仅 考 虑 


E 
LA RHE 


， 提 升 了 识别 效果 。 


守 注 意 力 模型 


其 主要 原 


表 2 情感 识别 结果 
系统 Accu(%) 
表情 符 本 身 极 性 56.49 
Bi-LSTM-text 68.51 
Bi-LSTM-text-emoji 70.80 
Emoji-Attention Bi-LSTM 74.86 


表 3 表情 符 注意 力 机 制 模型 的 不 同情 感 文本 的 识别 结果 。 
系统 类 别 P (%) R (%) F (%) 
正 性 76.05 71.11 73.49 
Bi-LSTM-text 中 性 66.57 51.71 58.21 
负 性 60.64 80.00 68.99 
E 性 73.10 77.44 75.21 
Bi-LSTM-text 
中 性 64.46 64.06 64.26 
+emoji 
4 74.75 69.57 72.07 
Emoji- 正 性 78.21 76.57 77.38 


may i 会 作 


ee ACHAT 
录用 入 0 @, ¥: LTAMPE ET OREN RD 
Attention 中 性 65.35 71.66 69.36 Bi-LSTM 负 性 80.82 74.49 77.53 
表 4 部 分 模型 识别 不 同 的 结果 
文本 LSTM-EA LSTM-E Truth 
1) 我 不 介意 秀 恩爱 ， 但 我 介意 秀 恩爱 刷 屏 ， 对 不 起 单身 狗 就 是 这 么 直接 条 老人 JJ 人 负面 正面 负面 
2) 不 好 意思 ， 我 悟性 低 ， 你 的 当头 一 棒 并 没有 坑 醒 我 ， 反 而 散 走 了 我 对 你 的 敬爱 和 感激 ， 谢 谢 凶 负面 正面 负面 
【两 车 当街 对 撞 互 不 相让 一 车 主 冲 下 车 后 画 风 突变 ! I3 日 ， 网 友 晒 出 视频 :河南 驻马店 某 
路 口 ， 一 红 一 白 两 车 当街 项 牛 ， 互 不 相让 。 在 两 车 连续 互 撞 两 次 后 ， 红 车 司机 下 车 与 白 车 司机 
3) 正 负面 正 
交谈 。 随 后 画 风 突变 ， 红 车 司机 上 车 ， 白 车 倒车 ， 两 人 面 带 笑容 ， 各 自 离开 ! PS: 驻马店 的 老 
铁 ， 没 法 理解 ~- 岂 .… 
险 哈哈 一 想起 上 次 南 坪 大 雨 3 天 出 不 来 坐 阳台 上 钓鱼 的 ， 我 大 cq ARAT ZGJIM 7 本 7 
Je pal JE 


想 吃 人 血 馒头 胡乱 放飞 的 /@ 暮 冥 战 机 :感谢 旅客 们 的 支持 和 理解 ! 
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本 文 以 表情 符 对 文本 的 情感 表达 起 作 着 重要 作用 这 一 认 知 
有 实 ,提出 基于 表情 符 注意 力 机 制 的 情感 分 析 模 型 ,在 模型 中 ， 
一 个 句子 中 的 每 个 词语 结合 表情 符 后 ， 将 会 被 施 以 不 同 的 权重 
对 待 ， 由 此 使 得 一 个 句子 的 语义 能 得 到 更 精确 的 表达 。 实 验 结 


hint 


4 


[aa 


果 显 示 ， 表 情 符 注 意 力 机 制 能 有 效 识 别 微 博 情感 极 性 ， 并 且 准 
确 率 与 F 值 都 超越 了 仅 将 表情 符 作为 特征 加 入 神经 网 络 的 方法 ， 
取得 了 较 好 的 结果 。 

本 文 仍 有 一 些 不 足 ， 在 标注 时 ， 对 微 博 的 极 性 标注 只 有 三 
K, 类 别 较 少 .另外 部 分 用 户 的 微 博文 本 与 表情 使 用 较为 随意 ， 
也 影响 了 模型 的 表现 。 下 一 步 将 研究 基于 表情 符 的 细 粒 度 的 微 
博 情 感 分 析 。 
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